Com este relatório pretendemos fazer uma análise sobre a COVID-19 em Portugal, com base nos dados da DGS disponíveis em: https://github.com/dssg-pt/covid19pt-data.
Este relatório tem como objetivo realizar uma análise detalhada dos seguintes tópicos:Nota: Houve um lapso na base de dados e os óbitos cumulativos por idade e por sexo para dia 5/10 estão todos a 0. Subituimos esses 0’s pelos valores do dia anterior.
#Libraries
library(data.table)
#Libraries
library(data.table)
library(ggplot2)
library(grid)
library(dplyr)
library(grid)
library(dplyr)
library(tibble)
library(reshape2)
library(ggpubr)
library(tibble)
library(reshape2)
library(ggpubr)
library(maps)
library(reshape2)
library(ggpubr)
library(maps)
library(ggiraph)
library(leaflet)
library(geojsonio)
library(gganimate)
library(gganimate)
library(plotly)
library(RColorBrewer)
library(sf)
library(grid)
library(gridExtra)
library(htmltools)
library(htmltools)
library(zoo)
#Importar dados
covid19pt <- fread("https://raw.githubusercontent.com/dssg-pt/covid19pt-data/master/data.csv")
[8%] Downloaded 7698 bytes...
[20%] Downloaded 18657 bytes...
[26%] Downloaded 24141 bytes...
[29%] Downloaded 26883 bytes...
[32%] Downloaded 29625 bytes...
[35%] Downloaded 32367 bytes...
[67%] Downloaded 62511 bytes...
[70%] Downloaded 65253 bytes...
[100%] Downloaded 92214 bytes...
library(gganimate)
library(plotly)
library(RColorBrewer)
library(sf)
library(grid)
library(gridExtra)
library(htmltools)
library(zoo)
#Importar dados
covid19pt <- fread("https://raw.githubusercontent.com/dssg-pt/covid19pt-data/master/data.csv")
covid19pt_testes <- fread("https://raw.githubusercontent.com/dssg-pt/covid19pt-data/master/amostras.csv")
[100%] Downloaded 14009 bytes...
Na base de dados utilizada, as colunas 41 à 46 apresentam a percentagem de casos infetados que reportaram o sintoma respetivo. O comportamento dos dados leva-nos a crer que estes valores sejam cumulativos.
Estes dados só foram registados de dia 03/03/2020 até dia 16/08/2020 e, para além disso, tal como é referido na base de dados online, estes dados são relativos apenas a uma percentagem, não-especificada e variável, dos casos infetados. Por este motivo, apesar de termos realizado duas análises, estes resultados podem não ser fiáveis nem representativos da realidade.
Os valores apresentadas neste gráfico de barras referem-se à percentagem de casos infetados que reportaram cada um dos sintomas. O sintoma mais frequente foi a tosse com 34% dos infetados a apresentarem esse sintoma, seguindo-se a febre com 27% e a cefaleia e dores musculares ambos com 20%.
Para entender melhor este gráfico é necessário perceber que os valores negativos indicam que houve uma diminuição na percentagem de pessoas com determinado sintoma clínico. Os valores positivos indicam que houve um aumento dessa percentagem sendo que os valores positivos menores do que o do dia anterior, significam que houve crescimento, mas menor.
Assim, é possível verificar que inicialmente existiu uma grande variação na frequência de casos confirmados que reportaram cada um dos sintomas. É de notar que a partir de junho esta variação foi sendo cada vez menor tornando os valores mais constantes, à exceção da tosse.
Um dos fatores importantes a ter em conta é o número de pessoas testadas para a COVID-19. Assim sendo, utilizámos outra base de dados da mesma fonte para obter informações relativas à testagem.
É importante notar que os valores da base de dados “correspondem ao número de amostras processadas para diagnóstico de SARS-CoV-2 em laboratórios públicos e privados desde o dia 1 de março.” Para além disso, no dashboard da DGS dizem ainda que “Os dados diários após 2 de abril de 2020 ainda estão a ser recolhidos, pelo que os valores no gráfico poderão sofrer alterações.” Existe a possibilidade de, a cada dia, dados referentes a dias anteriores serem alterados, provavelmente pelo facto da informação relativa ao processamento de amostras ser recebida pela DGS com alguns dias de desfasamento.
Com a análise deste gráfico é possível verificar que o número de testes diários realizados tem vindo a demonstrar uma tendência crescente.
É ainda possível tirar outras conclusões, nomeadamente que os dias com menor testagem são maioritariamente o domingo, mas também o sábado, e que os dias com maior testagem são principalmente as terças e quartas.
Segundo o gráfico de linhas, em abril verificou-se a maior percentagem de testes positivos face ao número de testes totais, com valores perto dos 15%. A partir daí esta percentagem tem vindo a diminuir o que mostra que: há menos casos positivos e/ou há mais testes a serem realizados por dia. Nos últimos meses a percentagem foi quase sempre menor do que 5% o que, face aos meses anteriores, pode demonstrar que a testagem tem sido mais abrangente, sendo provável que se esteja a testar grande parte dos casos positivos.
Além disso, podemos ver que, principalmente ao domingo, a percentagem de testes positivos é constantemente maior face aos outros dias da semana. Esta informação é coerente com o gráfico anterior, uma vez que é nestes dias que se verifica um menor número de testes diários e assim, supomos que dão primazia aos casos mais urgentes, aumentando assim a percentagem de testes positivos ao domingo. O contrário verifica-se à terça, dia em que são testadas mais pessoas, existindo normalmente uma menor percentagem de testes positivos.
Neste tópico vamos abordar a incidência (número de novos casos diários), a taxa de incidência (número de novos casos diários/população em risco), número de casos cumulativos em valor absoluto e prevalência (número total de casos/população).
Na linha da incidência é possível ver que o número de casos diários teve um pico no dia 10/04/2020. Uma vez que o número de testes não aumentou de forma significativa nos dias anteriores, uma das justificações possíveis é ter ocorrido um lapso na notificação dos casos nesse dia.
Podemos ainda constatar um ligeiro aumento no número de casos durante os meses de maio e junho. Este aumento pode ser justificado na sequência do período de férias, que apesar das restrições impostas, leva sempre a um aumento das deslocações e a um maior número de contactos entre pessoas. A diminuição da incidência verificada entre julho e agosto pode ser justificada pelo facto dos possíveis infetados com sintomas ligeiros não recorrerem à linha de saúde 24, por não quererem fazer um isolamento profilático durante as suas férias.
À data desta análise, desde o início de setembro, a subida do número de casos tem sido crescente, sendo possíveis justificações:No gráfico da Evolução da Taxa de Testes Positivos, é possível ver que, desde o início de setembro, tem havido um aumento na percentagem de casos positivos. No entanto, não é um aumento tão acentuado como aquele verificado neste gráfico da Evolução da Incidência. Isto indica-nos que o aumento do número de casos não é totalmente explicado pelo aumento do número de testes realizados.
Neste gráfico e mapa podemos ver que Lisboa e Vale do Tejo é a ARS com mais casos, seguindo-se a ARS Norte. Com menos casos, é de realçar os Açores e a Madeira que, com as estratégias implementadas para os turistas que obrigam a realização de um teste ao SARS-CoV-2 negativo até 72h antes da ida ou a realização do teste à chegada ao aeroporto, cumprindo o isolamento profilático até à receção do resultado do mesmo, conseguiram limitar o aumento do número de casos. No entanto, temos de ter presente que este gráfico e mapa não têm em consideração a população de cada ARS.